Понятия со словосочетанием «набор символов»
Набор символов (англ. character set) — таблица, задающая кодировку конечного множества символов алфавита (обычно элементов текста: букв, цифр, знаков препинания). Такая таблица сопоставляет каждому символу последовательность длиной в один или несколько символов другого алфавита (точек и тире в коде Mорзе, сигнальных флагов на флоте, нулей и единиц (битов) в компьютере).
Переноси́мый набо́р си́мволов (англ. portable character set) — набор из 103 символов, которые, согласно стандарту POSIX, должны присутствовать в любой используемой кодировке. Включает в себя все печатные символы US-ASCII и часть управляющих. Является базовым алфавитом для практически всех современных языков программирования.
Связанные понятия
Основная латиница или Управляющие символы C0 и основная латиница (англ. Basic Latin, C0 Controls and Basic Latin) — первый блок стандарта Юникод и единственный блок, кодируемый одним байтом в системе UTF-8. Блок содержит все буквы и управляющие коды из кодировки ASCII.
«Болга́рская кодиро́вка» (называемая также MIK, Interprog и «старый вариант ВЦ АН СССР») — это кодовая страница, применявшаяся на компьютерах болгарского производства (например, «Правец»). Эта кодировка не зафиксирована ни в одном нормативном документе. В Windows не используется, потому что в болгарских стандартах указана не она. Если в Windows 95-98-Me, International Version, установить болгарский язык, то в сессиях DOS будет использоваться кодовая страница CP855.
Символьный шрифт — разновидность шрифтов, состоящих из знаков, не имеющих отношения к алфавиту и не входящих в основной комплект шрифта.
Те́кстовый реда́ктор — самостоятельная компьютерная программа или компонент программного комплекса (например, редактор исходного кода интегрированной среды разработки или окно ввода в браузере), предназначенная для создания и изменения текстовых данных в общем и текстовых файлов в частности.
Те́кстовый файл — компьютерный файл, содержащий текстовые данные. Текстовым файлам противопоставляются двоичные (бинарные) файлы, в которых содержатся данные, не рассчитанные на интерпретацию в качестве текстовых (например, файлы, хранящие текст в закодированном или сжатом виде, или хранящие не текст, а звук, изображение или иные данные).
Заменяющий символ — символ, который используется, когда значение символа неизвестно или не может быть выражено в Юникоде.
Псевдогра́фика, псевдографические символы — совокупность символов, включённых в набор символов компьютерного шрифта, отображающих графические примитивы (линии, прямоугольники, треугольники, кресты, различная заливка и тому подобное). Псевдографические символы реализуются в рамках формата шрифта (к примеру, матрица 8×12 точек) и дополняют в таком наборе цифро-буквенные и служебные символы.
Директи́вы ассе́мблера — параметры (ключевые слова) в тексте программы на языке ассемблера, влияющие на процесс ассемблирования или свойства выходного файла.
Это
список сигнатур файлов, данных, используемых для идентификации или проверки содержимого файла. Эти сигнатуры также известны как магические числа.
Неразры́вный пробе́л (англ. non-breaking space) — элемент компьютерной кодировки текстов, отображающийся внутри строки подобно обычному пробелу, но не позволяющий программам отображения и печати разорвать в этом месте строку. Используется для автоматизации вёрстки, правила которой предписывают избегать разрыва строк в известных случаях (большей частью для удобочитаемости).
Стеганография, использующая текстовые контейнеры для скрытия данных, называется текстовой. При скрытии информации используются допущения при расположении и количестве символов в тексте, не учитываемые при прочтении человеком и компьютерном анализе текстового файла. Это может быть дополнительное количество пробелов и знаков табуляции в разных частях строки, чередование некоторых не учитываемых служебных символов, больших и маленьких букв, букв из разных алфавитов, но похоже выглядящих.
Те́кстовые да́нные (также те́кстовый форма́т) — представление информации строкового типа (то есть, последовательности печатных символов) в вычислительной системе. В MIME закодированным таким образом данным соответствует тип text/plain.
Комбинируемые диакритические знаки (англ. Combining Diacritical Marks) — седьмой блок стандарта Юникод. Содержит наиболее распространённые комбинируемые символы, а также преобразователь порядка диакритических знаков.
Это
сравнение двоичных форматов исполняемых файлов, которые, будучи однажды загружены соответствующим загрузчиком, могут быть непосредственно выполнены CPU, а не интерпретироваться программным обеспечением. В дополнение к двоичному коду приложения, исполняемые файлы могут содержать заголовки и таблицы с информацией о перемещении и адресной привязке, а также различные виды метаданных. Из этих перечисленных форматов, самые используемые — PE (на Microsoft Windows), ELF (на Linux и большинстве других...
Двоичный (бинарный) файл — в широком смысле: последовательность произвольных байтов. Название связано с тем, что байты состоят из бит, то есть двоичных (англ. binary) цифр.
Машинопи́сный апостро́ф (apostrophe, apostrophe-quote) — условное название знака, встречающегося на клавиатуре большинства пишущих машин с латинским шрифтом и компьютерных дисплеев. По историческим причинам лишь машинописный апостроф имеется на компьютерных клавиатурах и в 7-битовой кодировке ASCII. В качестве типографского символа он является суррогатом апострофа, кавычек, знака ударения, штриха (знака производной в математике, знака угловых минут и т. п.) и др. Часто смешивается с машинописным...
Региональный стандарт, региональные настройки (проф. жарг. лока́ль от англ. locale, /lɔ.kal/ или /ləuˈkɑ:l/) — набор параметров, определяющий региональные настройки пользовательского интерфейса, такие как язык, страна, часовой пояс, набор символов и т. п.
Подробнее: Локаль
Пустая строка (в информатике) — это термин, обозначающий значение строкового типа, не содержащее символов (то есть содержащее 0 символов, нулевой длины).
Последовательные файлы — файлы, хранящие информацию в неструктурированном (для поиска и обращения) виде. Поиск в таких файлах осуществляется последовательным считыванием файла с начала и сравнением «всего» с искомым. Так же и обращение к определённому участку файла каждый раз требует «чтения с начала».
Бу́фер обме́на (англ. clipboard) — промежуточное хранилище данных, предоставляемое программным обеспечением и предназначенное для переноса или копирования между приложениями или частями одного приложения через операции вырезать, копировать, вставить.
Горизонтальная табуляция (HT, TAB) — управляющий символ таблицы ASCII с кодом 0916, используется для выравнивания текста в строках. Встретив этот символ, терминал перемещает каретку (или курсор) вправо на ближайшую позицию табуляции. Традиционно эти позиции располагаются каждые 8 знакомест, в колонках 1, 9, 17, 25… Вводится при помощи клавиши Tab ↹, во многих языках программирования обозначается как \t.
Строка подключения (англ. Connection string) это строка, которая содержит информацию, необходимую ODBC драйверу/OLE DB провайдеру для подключения к источнику данных. В качестве источника данных могут выступать базы данных, файлы с данными.
Печатные символы — элементы набора символов, имеющие графическое представление, например в виде значка на бумаге или определённого рисунка на экране. Примерами печатных символов являются буквы, цифры, знаки препинания и псевдографические символы.
Макрокоманда, макроопределение или мáкрос — программный алгоритм действий, записанный пользователем. Часто макросы применяют для выполнения рутинных действий. А также макрос — это символьное имя в шаблонах, заменяемое при обработке препроцессором на последовательность символов, например: фрагмент html-страницы в веб-шаблонах, или одно слово из словаря синонимов в синонимизаторах.
Немые клавиши, «Мёртвые клавиши» (англ. dead keys) — клавиши на компьютерных клавиатурах или пишущих машинках, позволяющие изменить вид следующего вводимого символа. На печатных машинках нажатие на немую клавишу ставит надстрочный символ, но не сдвигает каретку на следующий символ. На компьютерах нажатие немой клавиши изменяет код следующего вводимого символа. К примеру, последовательность ⌥ Option+`, e на Macintosh создаёт символ «è».
Машинопи́сный обра́тный апостро́ф (знак побо́чного ударе́ния) — условное название знака, встречающегося на большинстве компьютерных клавиатур; в пишущих машинках с латинским шрифтом соответствующая клавиша использовалась для печати \-образного диакритического знака — ̀ (фр. accent grave, церк.-слав. варíя) — при нажатии на неё каретка не передвигалась, так что очередная буква печаталась под этим знаком. В качестве типографского символа машинописный обратный апостроф является эрзацем открывающей одиночной...
Encrypting File System (EFS) —
система шифрования данных, реализующая шифрование на уровне файлов в операционных системах Microsoft Windows NT (начиная с Windows 2000 и выше), за исключением «домашних» версий (Windows XP Home Edition, Windows Vista Basic, Windows Vista Home Premium, Windows 7 Starter (Home Basic и Premium), Windows 10 Home). Данная система предоставляет возможность «прозрачного шифрования» данных, хранящихся на разделах с файловой системой NTFS, для защиты потенциально конфиденциальных...
Синтаксическая ошибка может возникать при некорректном вводе уравнения в калькулятор. Это может быть вызвано, например, путём открытия скобок без их закрытия, или, реже, вводом нескольких десятичных разделителей подряд.
Подсве́тка си́нтаксиса — выделение синтаксических конструкций текста с использованием различных цветов, шрифтов и начертаний.
В программировании, ассемблерной вставкой называют возможность компилятора встраивать низкоуровневый код, написанный на ассемблере, в программу, написанную на языке высокого уровня, например, Си или Ada. Использование ассемблерных вставок может преследовать следующие цели...
Подробнее: Ассемблерная вставка
Шестиби́тные кодиро́вки применялись в компьютерах, производившихся в США в 1950-х — 1960-х годах. Соответственно размер машинного слова на этих компьютерах был кратен 6 бит (например, 12, 18, 24, 36, 48, 60 бит). Такой размер символа позволял кодировать заглавные латинские буквы, арабские цифры, несколько знаков пунктуации и иногда управляющих символов (в те времена можно было обходиться без управляющих символов, так как текстовые файлы представляли собой последовательность записей фиксированной...
Перевод строки, или разрыв строки, — продолжение печати текста с новой строки, то есть с левого края на строку ниже, или уже на следующей странице. На компьютерах это осуществляется клавишей ввода Enter.
Компилируемый язык программирования — язык программирования, исходный код которого преобразуется компилятором в машинный код и записывается в файл с особым заголовком и/или расширением для последующей идентификации этого файла, как исполняемого операционной системой (в отличие от интерпретируемых языков программирования, чьи программы выполняются программой-интерпретатором).
Управля́ющие си́мволы — символы в кодировке, которым не приписано графическое представление, но которые используются для управления устройствами, организации передачи данных и других целей.
Комбинируемые полузнаки (англ. Combining Half Marks) — блок Юникода, содержащий части диакритических знаков, предназначенных для размещения над несколькими символами.
Расширения МФА (англ. IPA Extensions) — пятый блок стандарта Юникод. Содержит все символы, которые используются в Международном фонетическом алфавите.
Каретная нотация — способ записи управляющих символов в кодировке ASCII. Запись состоит из символа карета (^) и заглавной буквы; эта диграмма обозначает ASCII-код символа в соответствии с позицией буквы в английском алфавите. Например, символ конца передачи имеет номер 4 и представляется как ^D, поскольку D — четвертая буква алфавита. Нулевой символ записывается как ^@ (@ идет в таблице ASCII до A). Символ DEL имеет значение 127 и обычно записывается как ^?, потому что ASCII-символ ? идет до @ и...
Низкоуровневый язык программирования (язык программирования низкого уровня) — язык программирования, близкий к программированию непосредственно в машинных кодах используемого реального или виртуального (например, байт-код, Microsoft .NET) процессора. Для обозначения машинных команд обычно применяется мнемоническое обозначение. Это позволяет запоминать команды не в виде последовательности двоичных нулей и единиц, а в виде осмысленных сокращений слов человеческого языка (обычно английских).
Компилятор компиляторов — программа, воспринимающая синтаксическое или семантическое описание языка программирования и генерирующая компилятор для этого языка.
Парсер (англ. parser; от parse – анализ, разбор) или синтаксический анализатор — часть программы, преобразующей входные данные (как правило, текст) в структурированный формат. Парсер выполняет синтаксический анализ текста.
Подробнее: Синтаксический анализатор
Пул строк (англ. string pooling) относится к двум видам оптимизации компилятора, связанным со строками...
Юнико́д (чаще всего) или Унико́д (англ. Unicode) — стандарт кодирования символов, включающий в себя знаки почти всех письменных языков мира. В настоящее время стандарт является доминирующим в Интернете.
Автодополнение, автозавершение (англ. autocomplete) — функция в программах, предусматривающих интерактивный ввод текста (редакторы, оболочки командной строки, браузеры и т. д.) по дополнению текста по введённой его части.
Чувствительность к регистру символов (англ. case sensitivity) — особенность некоторых файловых систем, программ и языков программирования, состоящая в том, что если одинаковые имена отличаются регистром хотя бы одного символа (то есть заглавными или строчными буквами), то эти имена считаются разными. Например, слово «TEXT» и слово «Text» в программе, чувствительной к регистру символов — абсолютно разные слова. Файлы «Photo.jpg», «photo.jpg» и «photo.JPG» в файловой системе, чувствительной к регистру...